查看原文
其他

Nat Genet | 74种疾病130万个细胞!scRNA-seq与多基因疾病风险联合揭示单细胞疾病相关性

九生 测序中国 2022-11-14

scRNA-seq已成为单细胞分辨率测量基因表达丰度的首选工具,可用于揭示哪些基因在哪些细胞类型中活跃,并识别新的细胞群。将scRNA-seq与全基因组关联研究(GWAS)数据相结合,可提供更精细的分辨率,确定GWAS风险变异影响疾病的关键组织、细胞类型和细胞群。以往scRNA-seq与GWAS的整合研究主要集中在细胞类型注释,聚合来自相同细胞类型的细胞,但这种方法忽略了细胞类型中单细胞的异质性。

近日,美国麻省理工学院联合Broad研究所、加州大学等研究团队在Nature genetics上发表了题为“Polygenic enrichment distinguishes disease associations of individual cells in single-cell RNA-seq data”的研究文章。研究人员引入了单细胞疾病相关性评分(scDRS),这是一种在单细胞分辨率下将scRNA-seq 与多基因疾病风险联系起来的方法。scDRS不依赖于细胞类型注释,可通过GWAS鉴定出跨疾病相关基因过度表达的细胞。scDRS可识别GWAS中涉及疾病相关基因过度表达的细胞。研究人员将scDRS应用于涉及74种疾病的31个组织/器官的130万个单细胞基因表达谱,广泛概括了已知的细胞类型-疾病关联,确定了未被细胞类型标记捕获的疾病相关细胞亚群。文章发表于Nature Genetics


ScDRS方法概述:

scDRS可将来自scRNA-seq的基因表达谱与来自GWAS的多基因疾病信息相结合,将单个细胞与疾病联系起来。scDRS由三个步骤组成(图1):首先,scDRS使用MAGMA从GWAS数据中构建一组推定的疾病基因。其次,scDRS量化每个细胞中假定疾病基因的聚合表达,以生成细胞特异性原始疾病评分。第三,scDRS对每个细胞的原始疾病评分和原始对照评分进行标准化,然后根据所有对照基因中汇集的标准化对照评分分布计算细胞水平P值。

scDRS输出单个细胞水平的疾病关联P值、标准化疾病评分和1000组标准化控制评分,可用于下游应用。研究人员主要关注了三个下游分析。其一,进行细胞类型分析,将预定义的细胞类型与疾病相关联,并评估与预定义细胞类型的细胞间疾病相关的异质性。其二,进行个体细胞水平分析,将个体细胞与疾病相关联,并将个体细胞水平变量与scDRS疾病评分相关联。其三,进行基因水平分析,优先考虑其表达与scDRS疾病评分相关的疾病相关基因,从而反映与疾病GWAS相关基因的共表达。
研究人员结合16个scRNA-seq或snRNA-seq数据集共分析了74种疾病/特征的GWAS汇总统计数据,这些数据集涵盖来自小鼠(Musmusculus)和人类(Homosapiens)31个组织/器官的130万个单细胞。

图1. ScDRS方法概述,来源:Nature Genetics

研究人员将scDRS与三种单细胞评分的最先进方法(Seurat、Vision和VAM)进行了比较。从TMS (Muris Tabula Senis)单细胞图谱数据中对10,000个细胞进行了二次抽样,并随机选择了1,000个致病基因。结果显示,scDRS和Seurat产生了经过良好校准的P值,Vision显示出轻微的I型错误,VAM产生严重膨胀的I型错误(图2a)。

此外,研究人员从二次抽样的10,000个细胞中随机选择500个作为致病细胞,并人为地扰乱其表达水平。结果表明,scDRS在错误发现率(FDR)<0.1时获得了比Seurat和Vision更高的个体细胞疾病关联检测能力(图2b)。

图2. 评估ScDRS的校准能力,来源:Nature Genetics

随后,研究人员利用scDRS分析了来自74种疾病/特征的GWAS数据以及具有120种细胞类型的TMS数据,图3报告了19种细胞类型和22种疾病/特征的代表性子集的结果。在该子集中,scDRS确定了80个相关的细胞类型-疾病对,并检测到43个细胞内疾病相关异质性。对于细胞类型-疾病关联,scDRS广泛地将血液/免疫细胞类型与血液/免疫相关疾病/特征、脑细胞类型与脑相关疾病/特征以及其他细胞类型与其他疾病/特征相关联。

图3. 针对 74 种疾病和性状的 120 种 TMS 细胞类型的结果,来源:Nature Genetics

研究人员联合分析了所有TMS 数据中的T细胞,共产生了11个簇(图4a)。该研究考虑了十种自身免疫性疾病:炎症性肠病(IBD)、克罗恩病(CD)、溃疡性结肠炎(UC)、类风湿性关节炎(RA)、MS、自身免疫性状(AITs)、甲状腺功能减退(HT)、湿疹、哮喘(ASM)和呼吸道和耳鼻喉疾病(RR-ENT),并重点关注了与IBD相关的单个细胞。分析发现,387个IBD相关细胞形成了11个T细胞簇中的4个亚群。研究人员进一步比较了IBD与HT的个体T细胞关联,发现前四个与HT相关亚群不仅包括三个与IBD相关亚群,还包括簇10中独特的细胞亚群。

此外,研究人员研究了与自身免疫性疾病相关T细胞的异质性是否与T细胞效应梯度相关,并分别评估了CD4、CD8效应梯度是否与患者的scDRS疾病评分相关。结果表明CD4效应梯度与IBD、CD、UC、AIT和HT有很强的相关性,与湿疹和ASM的相关性较弱,和RA、MS和RR-ENT无显著关联。(图4)。

图4. 自身免疫性疾病中的异质T细胞亚群,来源:Nature Genetics

综上所述,研究团队通过广泛的模拟表明scDRS方法校准良好且功能强大,是一种在scRNA-seq数据中区分单个细胞疾病关联的有效方法。研究人员将scDRS与16个scRNA-seq数据集一起应用于74种疾病/特征,检测到了细胞类型中单个细胞疾病关联的异质性。这些发现有助于阐明GWAS风险变异影响疾病的分子机制。

参考文献:

Zhang, M.J., Hou, K., Dey, K.K. et al. Polygenic enrichment distinguishes disease associations of individual cells in single-cell RNA-seq data. Nat Genet (2022). https://doi.org/10.1038/s41588-022-01167-z

·END ·

热文推荐


13.5小时即可获得WGS诊断结果!遗传病快速诊断管理系统GTRx与时间赛跑

Nat Commun发布迄今最大规模、最全面的亚洲人群实体瘤体细胞突变图谱

侯英勇/丁琛/贺福初团队合作发布中国人群鳞状细胞癌蛋白质组学图谱

Nature 基于20万人全基因组测序绘制克隆性造血遗传易感性图谱


喜欢就点个“在看”吧

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存